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JE E: 为 了 实现 任务 执行 效率 与 执行 代价 的 同步 优化 , 提出 了 一 种 云 计算 环境 中 的 DAG 任务 多 目标 调度 优化 算法 。 
算法 将 多 目标 最 优化 问题 以 满足 Pareto 最 优 的 均衡 最 优 解 集合 的 形式 进行 建 模 , 以 局 发 式 方 式 对 模型 进行 求解 ;同时 ， 
为 了 衡量 多 目标 均衡 解 的 质量 ， 设 计 了 基于 hypervolume 方法 的 评估 机 制 ， 从 而 可 以 得 到 相互 冲突 目标 间 的 均衡 调度 
解 。 通 过 配置 云 环境 与 三 种 人 工 合成 工作 流 和 两 种 现实 科学 工作 流 的 仿真 实验 测试 ， 结 果 表明 ， 比 较 同 类 单 目 标 算法 
和 多 目标 启发 式 算 法 ， 算 法 不 仅 求解 质量 更 高 ， 而 且 解 的 均衡 度 更 好 ， 更 加 符合 现实 云 的 资源 使 用 特征 与 工作 流 调 度 
模式 。 
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Abstract: For implementing the synchronization optimization of tasks execution efficiency and execution cost, a multi-objective 


p scheduling optimization algorithm of DAG tasks in cloud environment is presented. Our algorithm defines the multi-objective 


optimization problem as the trade-off optimal solutions set satisfying Pareto optimal and solves this model by the heuristic 


method. At the same time, for evaluating the quality of multi-objective trade-off solutions, a evaluation mechanism based on 
hypervolume method is designed, which can obtain the trade-off scheduling solutions with conflict objectives. Through setting 
cloud environment and three kinds of synthetic workflow and two kinds of real-world scientific workflow, we construct some 
simulation experiments. The results show that, compared with the same type of single objective algorithm and multi-objective 
heuristic algorithm, our algorithm not only has higher solving quality, but has better trade-off degree of solutions, which can 
conform to the mode of resource utility and workflow scheduling in real-world cloud. 
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文 将 以 Amazon EC2 云 环 境 为 基础 解决 云 工作 流 调度 的 多 目标 

最 优化 问题 ， 重 点 关注 于 工作 流 调度 执行 跨度 与 执行 代价 的 最 

科学 领域 的 实验 任务 通常 定义 为 工作 流 形式 ， 其 任务 根据 ”优化 ， 寻 找 最 优 调度 方案 。 
数据 流 与 计算 相关 性 形成 链 式 结构 ， 如 计算 密集 型 和 数据 密集 相关 研究 中 ， 文 献 [ 和 提出 一 种 异 构 预 算 约 束 调度 算法 
型 工作 流 应 用 ， 其 数据 量 和 计算 需求 量 巨大 ， 需 要 高 性 能 计算 HBOS, 通过 定义 代价 因子 调整 可 用 预算 与 最 低 价格 的 比例 , 实 
环境 支持 运行 中。 云 计 算 的 出 现 为 科学 工作 流 的 执行 提供 了 更 。 ” 现 优 化 调度 。 文 献 [5] 提 出 一 种 异 构 最 快 完成 时 间 调 度 算法 
高 效 的 技术 与 支撑 环境 外 。 云 以 虚拟 机 Cvirtual machines, VM) HEFT, 通过 赋予 任务 不 同 优先 级 ,最 小 化 任务 调度 时 间 。 文献 
的 形式 提供 计算 资源 ， 而 工作 流 中 任务 与 计算 资源 间 的 映射 问 [9] 提出 一 种 基于 预算 约束 的 异 构 最 快 完成 时 间 算 法 BHEFT, 
题 即 为 工作 流 调度 问题 。 云 工作 流 调度 包括 两 个 层次 : 一 是 任 ”该 算法 是 对 HEFT 算法 的 扩展 实现 ， 考 虑 了 任务 调度 的 最 优 预 
务 与 VM 间 的 映射 ， 二 是 在 单个 VM 上 任务 的 顺序 执行 中 。 本 ” 算 约 束 问题 。 文献 [7] 提 出 基于 离散 粒子 群 优化 的 工作 流 调度 算 
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2 ”模型 描述 


24 工作 流 DAG 任务 模型 

定义 工作 流 应 用 为 有 向 无 循环 图 DAG, W-(4,D), Kr, 
A 表示 包括 n 个 任务 的 任务 集 ，4=Un i=1 {4}; D 表示 任务 间 
的 控制 流 和 数据 流 依赖 关系 ，D={(4;,4j,Datai)|(4i;,4)) EAx4}， 
Datay 表示 任务 Ai 5 A; m] B X de fes xk. 
pred(Aiy- (A«(AnA5Datax) € D RIRES 4; 的 前 驱 任 务 集 ， 即 必 
须 在 4; 开 始 之 前 完成 。 假 设 每 个 任务 4; 的 计算 负载 是 已 知 的 ， 
且 表 示 为 可 执行 的 机 器 指令 数量 。 
2.29 资源 模 

假设 云 平台 由 m 个 异 构 资源 集合 组 成 , R=Umj=1{Rj}, 由 
Amazon EC2 的 云 资源 类 型 提供 ， 如 : ml.small, ml.medium, 
ml.large、ml.xlarge、cl.medium X cl.xlarge。 对 于 确定 类 型 的 
给 定 资源 已 ， 其 平均 性 能 由 GFLOPs 进行 度量 ， 即 : Floating- 
point Operations Per Second， 每 秒 所 执行 的 浮 点 运算 次 数 。 在 本 
文 的 工作 流 模型 中 ， 假 设 工作 流 任务 可 以 并 行 执 行 的 方式 运行 
于 如 表 1 所 示 的 Amazon EC2 虚拟 机 实例 上 ， 资 源 使 用 以 单位 
小 时 收取 费用 ( 表 1 第 三 列 ), 最 终 的 用 户 付 费 成 本 不 仅 取 决 于 
资源 使 用 ， 而 且 包 括 数据 存储 与 不 同 VM 实例 间 的 数据 传输 ， 
具体 包括 以 下 四 个 部 分 : 每 小 时 的 资源 使 用 价格 PER; 单位 MB 
的 数据 存储 价格 PSgi; 单位 MB 的 数据 接收 价格 PIN; 单位 MB 
的 数据 发 送 价格 PORi。 
2.3 问题 定义 
本 文 的 工作 流 调 度 问 题 即 为 将 工作 流 任务 调度 至 Amazon 
云 资源 上 执行 ， 使 得 执行 时 间 makespan 和 经 济 代价 达到 最 小 。 
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S 


4 sched(4i) 表 示 任 务 少 调度 的 执行 资源 ， 以 下 分 别 定 义 两 个 优 
化 目标 : 

1) 执行 时 间 makespan 

令 execution time 1t(4i,R) 表 示 任 务 4; 在 资源 R=sched(4) 的 
计算 时 间 与 接收 来 自任 意 前 驱 任 务 Ap Epred(4)) 的 最 大 输入 数 
据 时间 之 和 ， 表 示 为 


Data workload ( A. 
1(A,R,)= max 一 十 (A) 
A, epred (A) 
peP b, 5 


a) 


RP :Datapi 表示 任务 Ap 与 4; 间 的 数据 传输 量 ，byj RITE AS Ap 
的 执行 资源 与 资源 Rj 间 的 带宽 ，workKload(4 表 示 任 务 A; 的 指 
SKE, RREI 的 计算 速度 ， 单 位 为 每 秒 执行 的 机 器 指 
令 数 MIPS ,任务 4; 的 完成 时 间 74i; 包 括 任务 本 身 的 执行 时 间 和 


标 ， 用 did 
(取决 于 资源 需求 量 )， 则 用 户 获 得 实例 ; 
s M 
Amazon EC2 提供 14 种 拥有 不 同 ' 
需 实 
Compute Unit) 进行 
处 理 了 这 些 资 源 的 平均 性 能 、 自 
算 能 力 的 代价 及 单位 费用 
(millions of floating point operation per second )。 本 文 的 多 
工作 流 调度 的 5 种 类 型 实例 进行 性 
表 1 Amazon EC2 实例 类 型 
价格 /$/h 
0.1 
0.4 
0.8 
0.2 
0.8 
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其 前 驱 的 执行 时 间 ， 表 示 为 


(A, sched(A,)), pred (A) = Ø 
T, 24 max (T, &t(A,sched(A)], (2) 


A 


pred (A) + Ø 


工作 流 的 执行 时 间 makespan 定义 为 所 有 任务 中 的 最 大 完 
成 时 间 为 


T, = max T(A, sched (A,)) (3) 
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2) 经 济 代 价 3 ”多 目标 优化 
工作 流 执行 的 经 济 代价 包 括 两 个 部 分 : 计算 代价 CCAA 
数据 传输 与 存储 代价 Cm, 多 目标 最 优化 问题 通常 可 定义 为 : 寻找 使 得 矢量 函数 
$ C(data) (4i,Rj) 表 示 任 务 十 在 资源 玉 上 执行 过 程 中 传输 oO=[ACoP00,… 无 co] 最 小 化 的 所 有 解 x， 其 中 ，o 表示 优化 目 
输入 数据 In(4))、 输 出 数据 Out(4) 及 存储 数据 Data(4j) 的 代价 ， ” 标 数 量 〈 本 文 为 两 个 目标 : 执行 时 间 makespan 和 经 济 代价 )。 


表示 为 工作 流 调度 问题 中 每 个 解 x 包括 两 个 矢量 : 第 一 个 矢量 为 包括 
C, = Data(A) xt(A,R)xPS, + à " 个 元 素 的 矢量 (x1,x2,.…,xn)，n 表示 工作 流 的 任务 数量 (n=|4))， 
In(A)x PI, + Out(A)x PO, xissched(Ai) ez 4E 58 Ai€ A 执行 的 资源 ;第 二 个 矢量 为 大 小 为 

4 C(comp) Rj 表示 使 用 资源 R; WI SET D. ALT] Ry n 的 排列 pz， 表示 所 有 任务 执行 的 顺序 。 

4 t(start) Ai 表示 任务 的 开始 时 间 ，t(end) Ai 表示 任务 的 结束 时 对 于 工作 流 调度 问题 ,同时 找到 实现 执行 时 间 makespan 和 
间 ， 可 表示 为 经 济 代 价 的 最 小 化 的 解 是 不 可 能 的 。 为 了 解决 这 一 问题 ， 本 文 
to ASR) + max Data, (5) 引入 Pareto 占 优 的 概念 对 同步 最 优 进 行 评估 。 

| Toute n 如 果 解 y 的 makespan 和 代价 均 小 于 解 z， 则 称 解 y 占 优 解 
同时 ， 假 设 传输 输入 数据 In(4)) 和 输出 数据 Out(4) 的 时 间 ”z。 相 反 ， 如 果 两 个 解 之 间 不 存在 相互 占 优 (一 个 解 拥有 更 小 
均 处 于 t(start) Ai 9 (end) 4i 之 间 。 makespan， 而 另 一 个 解 拥有 更 小 代价 )， 则 称 两 个 解 为 非 占 优 。 
考虑 在 资源 Ri 上 调度 的 p 个 任务 集合 为 {了 1,]2,.….yJp}，p<n ”以 图 1 为 例 , fa 占 优 解 5»”， 由 于 其 拥有 更 好 的 makespan 和 代 

H sched( 有 =R,iE[1,p]， 任 务 基 于 开始 时 间 进 行 排列 : start) 介 。 同 样 地 ， 解 a 占 优 解 c。 同 时 ， 解 a 与 解 4 是 非 占 优 的 ， 
J1« t(start) J2<...<t(start) Jp。 基 于 以 上 排列 ， 将 所 有 任务 划分 于 解 a 的 makespan 更 优 , 而 解 a 的 代价 更 优 。 最 优 非 占 优 解 


为 4(g<p) 个 不 同 的 群 组 G0)k，1<k<q， 使 得 同一 组 内 的 所 有 任 。” ”的 集合 称 为 Pareto 边界 (包含 解 a、d 和 e 的 趋势 线 )， 表 示 不 
务 可 以 在 无 须 释 放 资 源 的 同时 连续 执行 。 群 组 中 拥有 最 大 开始 。” 同 目 标 间 的 均衡 解 集合 。 该 集合 中 的 每 个 解 表示 拥有 不 同 
时 间 的 任务 完成 后 ， 资 源 即 可 释放 。 makespan 和 代价 的 工作 流 任务 的 不 同 映射 方案 。 
通过 以 下 三 个 规则 ， 构 造 第 一 个 群 组 G0) 1-4...) 度量 均衡 解 质量 的 方法 为 超 体积 hypervolume。 给 定 均 衡 解 
r<p: X KES, hypervolume HV(X) 测 量 的 是 了 中 的 点 与 参考 点 W p] 
规则 1 第 1 个 任务 九 属 于 第 一 个 群 组 : JEG) 1; 的 封 闲 区 域 ， 如 图 1 所 示 ， 通 常 选择 为 最 大 目标 值 ( 即 最 高 的 
规则 2 每 个 任务 Jie G0) 1(2<i<n) 在 资源 释放 前 完成 。 这 makespan 和 经 济 代价 )。 因 此 ， 在 了 中 的 点 越 多 不 同 越 好 ， 其 
表明 由 于 .ii 的 执行 ， 资 源 仍 被 租用 时 五 即 可 开始 : HV) 值 也 越 高 。 图 1 中 ， 包 含 实 线 图 周围 点 的 解 集合 优 于 包 
gem < gm [E pam © 含 正方 形 中 点 集合 的 解 ， 因 此 ， 包 含 所 有 实 线 图 周围 点 的 集合 
3600 的 hypervolume 值 高 于 包含 正方 形 中 点 集合 的 hypervolume 值 。 
规则 3 下 一 任务 JCO 1(r+1<p) 在 资源 已 经 释放 时 ,在 
开始 时 间 (start) Jr+1 时 立即 开始 执行 ， 即 : 任务 完成 执行 ; Pai £ | 
后 ,执行 ,的 最 后 租用 周期 1 小 时 已 经 截止 ， 而 且 资 源 R TE “I y z 
f(end) Jr 5 t(start) Jr*1 间 是 为 空闲 ， 表 示 为 


- | ea | x 3600 < £” (7) -— - 
直到 最 后 的 任务 轧 分 配 至 一 个 群 组 后 , 即 可 建立 连续 的 群 E d 
组 。 第 二 个 群 组 G0) 2 以 Je RE A DL SEEN SE. SIE OUR 
的 策 咯 被 使 用 至 负 余 群 组 的 构建 中 。 建 立 所 有 群 组 后 ， 定 义 使 多 目 祭 工作 流 调度 算法 设计 
用 资源 Ri 的 代价 Comp) Ri 为 执行 所 有 群 组 需要 的 小 时 数 与 本 节 笔者 改进 了 传统 异 构 计 算 环境 中 的 单 目 标 优化 算法 
单位 小 时 代价 之 积 : HEFT 和 多 目标 优化 MOHEFT， 使 其 可 以 适用 于 Amazon EC2 
的 云 环境 中 。 传 统 异 构 系统 中 ， 资 源 数量 与 类 型 均 是 已 知 的 
EE d j (8) 。 然而 ， 云 计算 环境 中 的 资源 总 量 虽 是 有 限 的 ， 但 其 资源 提供 模 
式 是 按 需 和 动态 的 ,资源 可 用 性 及 其 计算 能 力 均 是 动态 变化 的 。 
执行 工作 流 W-(4,D) 的 经 济 代价 为 所 及 个 资源 的 计算 代 为 了 使 算法 适应 于 新 的 云 环境 , 考虑 资源 输入 量 为 m=Nx/， 
价 与 数据 传输 与 存储 代价 之 和 其 中 , 7 表示 云 提供 者 提供 的 实例 类 型 数量 ， 通 过 这 种 设置 ， 可 
Cs y ce "EL DES 


(AA Data, D 算法 1 为 单 目标 算法 CHEFT 的 执行 过 程 ， 算 法 的 设计 思 
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路 是 : 将 任务 调度 过 程 划 分 为 两 个 阶段 ， 任 务 分 级 阶段 和 任务 
映射 阶段 。 任 务 分 级 阶段 中 利用 自 顶 向 下 分 级 的 方式 计算 任务 
至 工作 流 结构 的 出 口 任务 间 的 距离 (以 任务 至 出 口 任务 之 间 所 
有 路 径 上 边 的 最 大 数量 表示 ), 然后 根据 各 个 任务 的 分 级 值 对 任 
务 进行 降序 排列 ， 得 到 任务 调度 优先 序列 ， 通 过 该 分 级 方法 可 
以 使 得 拥有 更 大 依赖 性 的 任务 优先 得 到 执行 。 任 务 映射 阶段 中 
即 在 所 有 资源 上 寻找 makespan 最 小 的 调度 解 。 在 该 过 程 中 , 为 
了 符合 云 环 境 的 调度 需求 ， 需 求 测试 局 部 调度 方案 是 否 需 求 多 
TON 个 资源 ， 如 果 不 多 于 N， 则 通过 公式 Tmausmaxape 
pred(Ranki) V Taptt(Ranki,R)} 计算 makespan, 否则 , 该 解 的 makespan 
设置 为 无 穷 。 

算法 1 CHEFT 

Require: W=(4, D),A=U n i=1{4iYM/ 工 作 流 应 用 

Require: N// 最 大 同步 实例 (资源 ) 数量 

Require: /不同 实例 类 型 数量 

Require: R= U m j=1 {R AMRA, m=NxI 

Ensure: schedy- ((Ausched(A;))4;€ 4}// 工 作 流 调 

function CHEFT(WR) 

Rank—B-RANK(4) // 根 据 B-rank 对 任务 排序 

schedm<-2// 初 始 化 工作 流 调度 为 空 集 

for i—1,n do// 迭 代 所 有 分 级 任务 

Tmin¢—00 

for j&—1,m do/G X Pr Vt Usi 

if COUNTRESOURCES(schedyw,m) <N then// 如 果 使 用 实例 
数 小 于 入 

TRanki— MaX Ap epred(Ranki) { TAp-t(Ranki Rj) //iF 5. Ranki 的 完成 
时 间 

else 

TRani—ool lE VAM E 3 Jc C 

end if 

if Tranki<T min then// 保 存 最 小 完成 时 间 


c 


D 


Tmin— TRanki 

Rnuin—Rj 

end if 

end for 

schedw«-schedw U (Ranki,Rmin)// 调 度 任务 

end for 

return schedw 

end function 

CHEFT 与 传统 单 目标 算法 不 同 之 处 在 于 算法 1 的 步骤 
12—16 行 ， 传 统 单 目标 算法 在 每 次 新 的 局 部 调度 中 计算 
makespan, mi CHEFT 则 测试 局 部 调度 方案 是 否 需求 多 于 个 
资源 ， 如 果 不 多 于 N， 则 计算 makespan 〈 行 13)， 和 否则 ， 该 解 
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dE, Si 云 计算 环境 中 面向 DAG 全 信和 


算法 2 为 多 目标 算法 CMOHEFT 的 执行 过 程 , 算法 的 设计 


H H; 


以 自 项 向 下 分 级 的 方式 计算 任务 分 级 值 , 然后 ， 


PS 


Da 


各 是 : 首先 


设置 可 容纳 天 个 多 目标 均衡 的 空 集 So IRV HIRI E E 


5 


i-1(schedw),schedw-((Ausched(A)))|; € AV/K 个 均衡 调度 解 集 


H 


F 列 的 任务 集合 ， 得 到 执行 顺序 。 算 法 的 目标 在 m 个 可 用 资 


源 上 是 不 断 扩 展 集合 S， 以 创建 并 存储 新 的 映射 解 。 新 的 映射 
的 搜索 过 程 为 寻找 到 K 个 解 为 止 。 最 后 ， 以 Pareto 占 优 及 
hypervolume 法 评估 解 的 质量 ， 得 到 多 目标 最 优 解 。 


算法 2 CMOHEFT 
Require: WW=(4,D),4= Un i=1{4i}// 工 作 流 应 用 
Require: N// 最 大 同步 实例 (资源 ) 数量 
Require: 1W/ 不 同 实 例 类 型 数量 

Require: R=Umj=1{RjY// 资 源 集合 ，m=NXxI 
Require: K// 均 衡 解数 量 
Ensure: S-UK 


function CMOHEFT( WR, K) 
Rankc—B-RANK(A) // 根 据 B-rank 对 任务 排序 
for k—1,K do//&] & K 个 空 的 工作 流 调度 解 


Si—92 

end for 

for i—1,n do// 迭 代 所 有 分 级 任务 
S'—29o 

for j—1,m do// 4X BE 9E i 
for k—1,K do/ 和 迭代 所 有 均衡 调 
se—S,U (Ranki, R) V 扩 展 所 有 中 间 调 度 方案 

if COUNTRESOURCES(schedw,m) >N then// 如 果 使 用 实例 


T 


Hr AA 
AX Ae 


- 


数 多 于 V 


和 一 -标记 调度 为 无 效 

C,—oo 

end if 

S'S’ U {sM/ 添 加 新 映射 至 所 有 中 间 调 度 


end for 


end for 
5S”*-SORTCROWDDIST(S',K)// 根 据 拥挤 距离 排序 
Se_FIRST(S’K)// 选 择 K 个 最 高 拥挤 距离 的 调度 


end for 


return S 
end function 


CMOHEFT 与 传统 多 目标 算法 的 不 同 之 处 在 于 算法 2 的 


17—20 ff, CMOHEFT 的 资源 量 约束 在 第 17 TRA, WRR 


违 


MEH 


背 ， 则 设置 为 无 限 ,这 可 以 使 算法 丢弃 第 24 行 中 的 解 ， 仅 仅 


违 


的 makespan 设置 为 无 限 ， 即 步骤 15。 通 过 该 方法 ， 无 效 调度 
方案 将 无 法 验证 行 17 中 的 条 件 ， 且 将 被 丢弃 并 而 保留 需求 
源 小 于 个 同步 实例 的 调度 方案 。 


ly 


资 


产 


H 


违背 资源 量 约束 ，makespan 和 代价 按 算 法 前 文 进行 计算 ,如 果 


生 至 多 NN 个 同步 资源 的 均衡 解 。 


算法 时 间 复 杂 度 分 析 。 给 定 包括 n 个 任务 和 m 个 资源 的 工 


作 流 调度 场景 , CHEFT 算法 需要 先 计算 每 个 任务 的 分 级 值 ， 该 
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过 程 的 时 间 复 杂 度 为 O(n)。 然 后 ， 需 要 将 排序 后 的 n MERE 
代 方 式 在 m 个 可 用 资源 上 寻找 执行 跨度 makespan 最 小 的 调度 
解 ， 该 过 程 的 时 间 复 杂 度 为 O(nxm)。 因 此 ，CHEFT 算法 的 时 
间 复 杂 度 为 O(n)+O(nxm)=O(nxm)。 
CMOHEFT 算法 与 CHEFT 算法 的 过 程 有 两 个 不 同 之 处 : 
一 是 算法 在 每 次 迭代 中 多 个 解 的 创建 方式 ， 二 是 考虑 资源 提供 
均衡 解 的 可 能 性 ,两 处 不 同 均 体现 在 CMOHEFT 算法 中 的 15~ 
考虑 均衡 解 的 集合 大 小 为 天 ， 通 常情 况 下 ， 均 衡 解 的 
数量 为 常数 , 旦 其 值 小 于 n 和 m, 而 CMOHEFT 算 法 比较 CHEFT 
仅 额 外 需要 执行 XK 次 迭代 ， 因 此 ，CMOHEFT 算法 的 最 差 时 间 
复杂 度 为 O(nxmxK)。 
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本 节 通 过 仿真 实验 以 评估 多 目标 算法 CMOHEFT 的 有 效 

性 ， 仿 真 平台 选择 WorkFlowSim023。 首 先 ， 给 出 了 评估 算法 性 
能 质量 的 比较 指标 ， 然 后 ， 描 述 了 测试 工作 流 的 不 同类 型 和 实 

验 中 Amazon EC2 设施 的 配置 情况 ,实验 中 除了 实现 CHEFT 和 
CMOHEFT 算法 之 外 ， 还 选择 了 POSH 算法 外 作为 性 能 比较 的 
参考 算法 ， 选 择 的 原因 是 该 算法 同 为 多 目标 优化 算法 ， 且 也 考 
虑 了 均衡 解 的 问题 。 
5.1 评估 指标 

考虑 三 个 指标 比较 三 种 算法 的 性 能 : 执行 工作 流 的 最 短 
makespan、 执 行 工 作 流 的 经 济 代价 及 hypervolume 评价 指标 。 
前 两 个 指标 主要 用 来 评价 单个 指标 的 优化 性 能 ,hypervolume 则 
是 评价 多 目标 最 优 均 衡 解 的 质量 。 

Hypervolume 的 具体 的 计算 方法 是 : 给 定 由 CMOHEFT 算 
法 计算 得 到 的 调度 均衡 解 的 集合 ， 定 义 HVQOGRE— 
hypervolume 值 ， 测 量 范 围 为 是 调度 解 集合 X 中 的 单个 点 〈 表 
示 一 个 调度 解 ) 与 所 选择 的 参考 点 丈 间 的 封 闲 区 域 ， 基 于 工作 
流 调度 目标 是 执行 makespan 与 执行 代价 的 同步 优化 ， 参 考点 
选取 为 调度 均衡 解 集合 全 中 的 最 高 的 makespan 和 执行 代价 cost 
所 表示 的 点 。 然 后 ， 将 解 集合 中 的 个 体 解 按 照 其 在 第 一 维 目 标 
上 的 值 进行 降序 排列 ， 按 照 以 下 公式 计算 个 体 解 产 的 独立 占 优 
区 域 的 Hypervolume 指标 : 

HV(pi)=|Imakespan(pi1)-makespan(pi)|X|cost(pi+1)-cost(pi) 
(10) 
其 中 , 2<i<K-1, K 表示 解 集合 中 的 解数 量 , makespan(pi) 表 示 角 
集中 第 i 个 个 体 解 在 执行 跨度 makespan 上 的 值 ，cost(p) 同 理 。 
5.2 工作 流 应 用 

实验 中 引入 两 种 类 型 的 工作 浙 
同属 性 的 多 类 型 的 人 工 合成 工作 浙 
实 工作 流 。 

D 人 工 合成 工作 流 

利用 随机 工作 流产 生 器 产生 三 种 类 型 合成 工作 流 ( 如 图 2(a) 
和 图 2b)), EE E a Xt, 
所 定义 的 工作 流 类 型 可 以 覆盖 多 种 类 型 的 工作 流 结构 : 


m» 


Tu 


应 用 进行 测试 : 人 工 配 置 不 
应 用 和 现实 科学 领域 中 的 现 
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F! 
徐 健 锐 ， 等 : 云 计算 环境 中 面向 DAG 任务 的 多 CAN 


Type-l 工作 流 : 任务 可 以 并 行 度 为 1 和 2 时 进行 执行 ; 

Type-2 工作 流 : 任务 执行 的 并 行 度 较 高 ， 且 工作 流 较 均衡 
(同一 层次 上 的 任务 数 相同 ); 
Type-3 工作 流 : 任务 执行 的 并 行 度 较 高 ， 
(同一 层次 上 的 任务 数 不 同 )。 

每 个 任务 的 大 小 和 数据 量 的 产生 符合 高 斯 分 布 ， 对 于 每 种 


晶 工 作 流 不 均衡 


> 


类 型 工作 流 ， 任 务 分 布 于 100 与 1000 之 间 ， 实 例 数 为 100。 
2) 现实 工作 流 应 
考虑 两 种 现实 工作 流 应 用 : WIEN2K 和 POV-Ray， 结 构 分 
别 如 图 2(c) 和 图 2(d). 
WIEN2K 是 基于 波纹 方法 并 利用 密度 泛 函 理论 计算 固体 电 


子 结构 的 一 种 材料 科学 工作 流 应 用 ， 属 于 Type-2 工作 流 类 型 ， 
连续 同步 任务 执行 的 两 个 并 行 部 分 组 成 。POV-Ray 是 一 种 构 
建筑 学 和 数 


建立 三 维 图 形 的 开放 工具 ， 多 用 于 生物 学 、 医 学 、 
ET Type-2 工作 流 类 型 。 


(a) 人 工 合成 工作 流 


结构 -均衡 (b) 人 工 合成 工作 流 结构 - 非 均衡 


"Cen 
Cii 
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C ieor > 


Cm 


E 


(c)WIEN2k 工作 流 结构 
"d getScenes 
V getFrame 
Y 
(povray (povray 
(Frame; pgn Frame.pgn p 2 


Y 


( povray ) povray 
(Frame. pgn A (Frame. pen 


m m A ti m] 
Archive EUER Archive 
I T 
: Y 
EE EX 
Png2yuv streaming Time 


(d)POV-Ray 工作 流 结构 
图 2 工作 流 应 用 结构 


5.3 ”资源 配置 
令 用 户 可 访问 的 Amazon 实例 的 最 大 数量 为 N=20, 实例 共 
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有 五 种 类 型 ， 如 表 1 所 示 ， 即 : 
it Amazon 至 外 部 互联 网 间 的 输出 数据 量 为 常数 ， 且 该 数据 输 
此 不 会 影响 调度 结果 。 仿 
实验 中 ， 数 据 发 送 与 接收 的 代价 均 为 0， 即 PIr=0, POn;-0. 


出 仅 发 生 于 工作 流 执行 的 结 


6 ”实验 结果 评估 


6.1 合成 工作 流 
1)Type-1 工作 流 


I-5, m-NXI-20x5-100. [z]H 


hypervolume 均 优 于 POSH. 
仅 得 到 最 优 makespan HA 
周 度 解 时 


CMOHEFT 在 计算 


PRAS CHEFT 是 


图 3 是 三 种 算法 在 makespan、 经 济 代价 和 hypervolume 性 
能 上 的 结果 。 图 3(a) 表 明 CMOHEFT 在 所 有 讨 
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EHR] 


IIl 
E | 
di 云 计算 环境 中 面向 DAG 人 和 TETEP 


M, 


估 实 例 上 的 


于 该 算法 


一 解 .明显 地 , 对 于 Type-1 工作 流 ， 
台 终 拥有 相同 的 


hypervolume 值 ， 


这 表明 均衡 解 的 最 优 集合 的 形 
发 生变 化 。 在 makespan 方面 
解 ， 这 证 实 了 CMOHEFT f 
而 POSH 以 HEFT 得 到 初始 角 
3(c) 表 明 CMOHEFT 与 POSH 
种 算法 在 整个 工作 流 的 执行 


€ 3(b) )， 三 种 算法 得 到 
比较 CHEFT 并 未 
因此 也 是 相同 的 makespan。 
导 到 了 相同 的 成 本 最 低调 度 ， 两 
上 均 只 使 用 了 ml.small， 这 主要 是 


cr 


( 信 — u— 


价 最 高 的 。 


该 类 型 工作 流 的 较 低 的 六 


图 3(d) 是 CMOHEFT 与 POSH 


CMOHEFT 的 解 


质量 更 高 。 
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图 


2)Type-2 工作 流 
图 4 是 Type-2 T. 
工作 流 规 模 ，CMOHE 


多 态 并 未 随 着 工作 流 规模 的 变化 


导致 的 ， 而 CHEFT 则 总 是 代 
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的 执行 结果 。 图 4(a) 表 明 ， 对 于 所 有 


FT 在 均衡 解 


不 同 的 工作 流 规模 会 


有 不 同 hypervolume 


界 ， 这 表明 该 问题 中 Pareto 边界 的 
务 数量 。 对 于 makespan ( 


了 相同 
HUP EE 


的 均衡 解 图 示 ， 明 显 地 ， 

LAKE UL, CMOHEFT 以 增加 约 796 
的 时 间 开 销 就 可 以 平均 降低 若 45% 的 执行 代价 ， 而 POSH 得 到 
相同 的 代价 时 ， 在 makespan 指标 上 则 增加 了 约 2596. 


质量 上 均 是 优 于 POSH 的 。 
[& f] Pareto 边 
PIRR EF WEE SU IRE 
图 (b))，CMOHEFT 与 POSH 甚至 在 


有 些 情况 下 可 

于 CHEFT J A 
CMOHEFT 与 POSH 
TZ TB 


得 到 了 
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工作 流 


以 得 到 较 CHEFT 更 优 的 makespan， 这 主要 是 | 
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工作 流 任务 数 


Fifi 


焚 属 性 ， 较 容易 收敛 于 局 部 最 优 ， 而 


而 降低 了 30% 左 右 的 代价 。 
加 450% 的 makespan 7 
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以 更 大 的 搜索 空间 克服 了 这 一 缺陷 。 经 济 
X] 4(c)), CMOHEFT 5 POSH 则 以 最 优 的 makespan 
同 的 最 低 代价 。 

4(d) 得 到 的 CMOHEFT 与 POSH 的 均衡 解 间 的 不 同 较 
Type-1 更 为 明显 。 此 时 , CMOHEFT 仅 以 增加 1.4% 的 makespan 
而 POSH 得 到 相同 的 代价 则 需要 增 
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5 是 Type-3 工作 流 的 执行 结果 , 进一步 证 明了 以 上 两 类 
工作 流 的 验证 结果 。 总 体 看 来 ，CMOHEFT 更 适应 于 Amazon 
EC2 云 环境 中 的 工作 流 多 目标 调度 。 
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6(a) 表明， 与 合成 工作 流 类 似 ，CMOHEFT 在 63 资源 数量 的 影响 
hypervolume 上 仍 优 于 POSH, 并 且 , 两 间 的 差距 明显 大 于 以 上 本 节 分 析 放 宽 同 步 可 使 用 资源 的 数量 的 限制 对 算法 性 能 的 
合成 工作 流 。 这 是 由 于 现实 工作 流 应 用 的 求解 复杂 度 变 高 的 原 影响， 主要 集中 于 研究 资源 数量 规模 与 额外 资源 对 计算 均衡 解 
因 导 致 的 。 6(b) 和 6(c) 也 证 实 了 合成 工作 流 中 的 结论 。 在 ”的 影响 。 实 验 配置 以 WIEN2k 工作 流 为 测试 源 。 
makespan 方面 , 三 种 算法 性 能 相同 。 而 在 代价 方面 , CMOHEFT 图 8 和 图 9 是 同步 资源 数量 设置 为 20、50 和 100 时 的 执 
tj POSH 得 到 的 代价 更 低 。 图 6(d) 中 两 种 算法 的 均衡 解 方面 得 。” 行 结果 。 图 8 是 资源 数量 对 最 小 makespan 的 影响 。 可 以 看 出 ， 
到 的 结果 与 Type-2 类 似 ，CMOHEFT 可 以 更 小 的 makespan 开 ”CMOHEFT 计算 得 到 的 最 小 makespan 会 随 着 资源 使 用 数量 的 
销 节省 更 多 的 代价 。 增加 而 降低 。 在 所 有 情形 中 ， 算 法 在 计算 最 优 调度 方案 时 均 会 
利用 所 有 人 允许 使 用 的 资源 量 。 
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Kii 56 9 是 CMOHEFH 5 POSH 计算 得 到 的 Pareto 边界 情况 。 
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| 3 此 图 的 目的 是 观察 不 同 资源 数量 对 不 同 均衡 解 的 影响 。 对 于 
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zii Liter 高 的 资源 量 表明 代价 更 高 而 调度 时 间 更 短 〈 体 现 于 边界 左 侧 )。 
(a)hypervolume (b)makespan 在 最 小 化 调度 代价 方面 ， 得 到 的 解 并 未 受到 同步 使 用 资源 量 的 
TREE 影响 。 对 于 POSH (图 9(b))， 性 能 仍 低 于 CMOHEFT。 资 源 量 
0.9 P ~ è A " = 
os f "ke 的 增加 会 导致 POSH 的 调度 时 间 变 短 但 代价 更 高 。 同 时 ， 其 中 
š d TE 的 一 些 调度 方案 会 违背 允许 使 用 的 同步 资源 量 的 限制 。 
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2)POV-Ray 工作 流 
POV-Ray 工作 流 的 执行 结果 与 WIEN2k 工作 流 是 类 似 的 ， 
如 图 7 所 示 。 对 于 该 类 工作 流 ， 任 务 数量 更 高 ，CMOHEFT it 
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图 8 不 同 资源 数量 限制 下 的 最 短 makespan 


算 高 质量 均衡 解 集合 将 越 困 难 ， 这 也 导致 hypervolume 值 会 随 
着 任务 数量 增加 而 下 降 。 然 而 ， 对 于 POSH 则 未 出 现 明显 类 似 M 
的 结果 ， 但 其 Pareto 边界 的 质量 明显 也 弱 于 CMOHEFT。 其 他 2 
结果 则 与 以 上 工作 流 类 型 是 类 似 的 。 e A 资源 数 =100 
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» iw [ 执行 经 济 代价 的 同步 最 小 化 为 目标 ， 通 过 启发 式 方法 得 到 了 多 
Bem > AEE : . 
E 标 间 的 均衡 最 优 解 集 合 ， 并 以 Pareto 边界 和 hypervolume 值 
mE E XXXI LA 的 方式 对 均衡 解 进 行 了 有 效 性 评估 。 通 过 三 种 人 工 合成 工作 流 
-全 makespan 
、 和 两 种 现实 科学 工作 流 任 务 的 测试 ， 结 果 表 明 ，CMOHEFT 算 
(经 济 代价 (d) 均 衡 解 l d ih : 
法 比较 单 目 标的 CHEFT 算法 和 多 目标 的 POSH 算法 ， 大 多 数 


图 7 POV-ray 工作 流 


工作 流 类 型 中 均 可 以 得 到 更 小 的 执行 跨度 和 经 济 代价 。 
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